Topological Data Analysis; TDA
TDAとは代数的位相幾何学(algebraic topology)という分野を基礎に持つ,データの構造に着目した解析手法であり,画像・たんぱく質のような複雑な構造・ネットワークなどのデータに対して強みを持っています.
TDAではある意味大雑把にデータの構造を捉え,定性的な特徴を得ることができます.そのため,ノイズに対してロバストである,座標系や次元数に依存しないというメリットがありますが,その反面,そのままの形では分類には適用できても回帰問題には適用しづらいという弱点もあります.
$ H_0
0次のホモロジーグループ
データの連結成分の数
具体的には、データセット内の独立したクラスターやグループの数
データが完全に連結している場合、H0は1になる
データが複数の独立したグループに分かれている場合、H0はそのグループの数
$ H_1
H1は1次のホモロジーグループ
データのループや空洞の数
具体的には、データセット内の閉じたループや空間の空洞の数
ドーナツのような形状を持つデータセットは、中央の空洞と、ドーナツの外側を形成する大きなループの2つのループを持つため、H1は2になる